بهینه سازی هسته های چندگانه در ماشین بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب آمیز

نویسندگان

محمدعلی زارع چاهوکی

دانشگاه یزد سیدحمیدرضا محمدی

دانشجوی کارشناسی ارشد

چکیده

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص گذاری آن ها، قابلیت جستجوی سریع اطلاعات را به کاربران می دهند. یکی از چالش های مهم در استفاده از این ابزار، صفحاتی هستند که از آن ها به عنوان صفحات فریب آمیز نام برده می شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع شده است که می توان به روش هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از روش های یادگیری ماشین بر اساس ویژگی های صفحات اشاره کرد. ازجمله الگوریتم های یادگیری ماشین که در این حوزه استفاده شده است ولی نتایج قابل توجهی را ارائه نکرده، الگوریتم ماشین بردارپشتیبان[i] (svm) است. استفاده از هسته در ساختار طبقه بند svm باعث می شود که داده هایی که دارای الگوی غیرخطی هستند با نگاشت به فضایی با ابعاد بیش تر بتوانند با مدل خطی تفکیک پذیر شوند. این کار باعث افزایش دقت تفکیک کنندگی مدل یادگیری ماشین می شود. اخیراً توسعه ایی از svm با نام svm جفتی[ii] (tsvm) ارائه شده است که با تغییر در فرضیه اولیه آن، از دو اَبَرصفحه[iii] برای تفکیک نمونه های هر کلاس استفاده می کند و توانسته نتایج بهتری در طبقه بندی ارائه کند. به دلیل استفاده از دو ابرصفحه در tsvm، لذا بهتر است تا از هسته های چندگانه در ساختار آن استفاده شود. به دلیل اینکه توابع هسته در هر کاربرد اختصاصی هستند لذا نمی توان از یک هسته عمومی برای همه کاربردها استفاده کرد. در این مقاله برای بهینه سازی ترکیب های بهینه توابع هسته پایه، از روشی تکاملی مبتنی بر الگوریتم ژنتیک (ga) استفاده شده است که با بهره گیری از آن در فرآیند تصمیم گیری هر اَبَرصفحه tsvm، بهبود در تشخیص صفحات فریب حاصل گردیده است. برای پیاده سازی و ارزیابی روش پیشنهادی، از مجموعه دادگان uk-2006 و uk-2007 استفاده شده است که نتایج حاصل بیانگر مؤثر بودن ایده پیشنهادی در این پژوهش است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهینه‌سازی هسته‌های چندگانه در ماشین‌بردارپشتیبان جفتی برای کاهش شکاف معنایی تشخیص صفحات فریب‌آمیز

چکیده: موتورهای جستجو با خزش صفحات موجود در اینترنت و شاخص‌گذاری آن‌ها، قابلیت جستجوی سریع اطلاعات را به کاربران می‌دهند. یکی از چالش‌های مهم در استفاده از این ابزار، صفحاتی هستند که از آن‌ها به‌عنوان صفحات فریب‌آمیز نام‌ برده می‌شود. رویکردهای مختلفی جهت تشخیص صفحات فریب ابداع ‌شده است که می‌توان به روش‌هایی مانند سنجش میزان شباهت سبک کدهای صفحات، تحلیل الگوی زبانی صفحات و همچنین استفاده از رو...

متن کامل

ارائه روشی جهت بهبود تشخیص صفحات فریب آمیز در گراف وب فارسی

امروزه با افزایش چشمگیر استفاده از اینترنت و همچنین رشد بسیار فزاینده صفحات وب، استفاده از موتورهای جستجو اهمیت بیشتری پیدا کرده است. در نتیجه بعضی از افراد برای بدست آوردن مخاطب بیشتر و در نتیجه سود بیشتر تلاش می کنند موتورهای جستجو را گمراه کنند و رتبه صفحات مورد نظر خود را با روش های نامشروع بالا ببرند. شناسایی این صفحات (که به آنها صفحات فریبکار می گویند) می تواند نقشی اساسی در بهبود عملکرد...

15 صفحه اول

رتیه بندی هوشمند گراف وب برای مقابله با صفحات فریب آمیز

با گسترش روزافزون وب در سالهای اخیر و کاربرد های آن در همه زمینه ها از جمله تجارت الکترونیک، بازرگانی و اجتماعی و همچنین با بالا رفتن پتانسیل سود در وب، اکثر توسعه دهندگان صفحات به فکر بازدیدکننده بیشتر از سایت ها هستند. در این میان تشخیص محتوای با کیفیت از تلاش های فریب کارانه جهت به بازی گرفتن موتورهای جستجو به یکی از چالش های اصلی این موتورها تبدیل شده است. تاکنون الگوریتم های مختلفی برای مق...

15 صفحه اول

بررسی عملکرد الگوریتم های فراابتکاری جمعیت مبنا به منظور بهینه سازی پارامترهای ماشین های بردارپشتیبان درطبقه بندی تصاویرپلاریمتریک راداری

با توجه به اینکه استفاده از پلاریزاسیون های مختلف امواج الکترومغناطیسی در تصویربرداری پلاریمتریک راداری اطلاعاتی غنی از جنبه های مختلف عوارض را فراهم می کند. امروزه تصاویر پلاریمتری به عنوان ابزار قوی و کارآمد در زمینه ی شناسایی عوارض مختلف در مناطق جغرافیایی پیچیده مورد توجه قرارگرفته اند. به منظور استخراج اطلاعات، طبقه بندی این تصاویر حائز اهمیت می-باشد. طبقه بندی کننده ی ماشین های بردار پشتی...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مهندسی برق دانشگاه تبریز

جلد ۴۶، شماره ۴، صفحات ۱۳۵-۱۴۵

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023